# _*_ coding:utf-8 _*_
# @File  : save_copy_json.py
# @Time  : 2022-03-14  15:55
# @Author: zizle
import json

json_str = [{"state":"1","msg":"","id":"206972","title":"初探上下游产品价差和利润对PTA价格的影响","author":"王吉帅","content":"""
<p>
    <strong>上游能化产业利润与价格的关联性较大</strong>
</p>
<p>
    <strong>本文旨在探讨PTA上下游产品的价差和利润因子在量化策略中的作用。笔者先将价差和利润根据上下游产品进行分类，分析价差和利润因子的形态特征，并使用Bootstrap重抽样法、Box—Cox变换法和比值法三种方式调整数据样本，使其符合正态分布特征。后根据价差和利润偏离正常值时发出的信号，测试该信号与PTA价格走势的相关性。经过调整测试得知，除PX因子外，上游产品的利润和价差状况能够反映在PTA价格上。虽然下游产品的利润因子能较好符合正态分布特征，但经过调整测试得知，大部分下游产品的利润因子不能反映PTA价格走势。总体来看，PTA上游能化产业利润与PTA价格的关联性较大，而下游聚酯产业利润与PTA价格的关联性较小。</strong>
</p>
<p>
    <strong>[因子概述]</strong>
</p>
<p>本文选取与PTA产业链相关的基本面数据，探究上下游产品的价差和利润波动对PTA价格的影响。因为PTA具有较长的上下游产业链，涉及多个品种且较为复杂，所以笔者按产业链将基本面数据分为上游因子和下游因子两类。</p>
<p>上游因子</p>
<p>PTA上游原材料来源单一，基本由PX生产而来，市场上近98%的PX被用作生产PTA，两者具有较强的相关性。PX的原料是石油，石油经过馏分获得石脑油，从石脑油中提炼出MX，再由MX生产PX，最终获得PTA。</p>
<p>通过上游原材料价格与下游产品价格对比及生产工艺分析，可得出如下价格传导公式：</p>
<p>
    <img src=\"http://www.qhdb.com.cn/UploadFiles/ArtImg/20231203/20231203230108_1.jpg\" style=\"float:none;\" title=\"1.jpg\" border=\"0\" hspace=\"0\" vspace=\"0\"/>
</p>
<p>本文选取的上游基本面数据有价差/利润：石油裂解价差/新加坡利润、石油裂解价差/欧洲利润、石油裂解价差/美国利润、上游价差/石脑油—原油利润、上游价差/PX—石脑油利润、上游价差/纯苯—石脑油利润、上游价差/甲苯—石脑油、PX利润。</p>
<p>下游因子</p>
<p>国内市场中约75%的PTA被用作生产聚酯纤维，涤纶短纤，长纤POY、FDY和DTY，主要用于家纺面料和服装面料；20%的PTA被用作生产瓶级聚酯用于饮料包装；5%左右的PTA被用作生产聚脂薄膜。</p>
<p>通过上游原材料价格与下游产品价格对比及生产工艺分析，可得出如下价格传导公式：</p>
<p>
    <img src=\"http://www.qhdb.com.cn/UploadFiles/ArtImg/20231203/20231203230131_2.jpg\" style=\"float:none;\" title=\"2.jpg\" border=\"0\" hspace=\"0\" vspace=\"0\"/>
</p>
<p>本文选取的下游基本面指标有利润：短纤利润、POY利润、DTY利润、FDY利润、聚酯瓶片利润、聚酯切片利润。</p>
<p>
    <strong>[策略说明]</strong>
</p>
<p>本文旨在初探PTA上下游产品的价差和利润指标对PTA价格的影响，围绕上游因子和下游因子做数据变形和调整。</p>
<p>一方面，从经济学理论出发，因为产业利润过高或过低的状态均无法继续维持，所以理论上利润因子容易出现围绕基本区间回归的态势。在某些阶段，随着产业链发展，在产品主导权和定价权转移，以及短期供需不均衡的情况下，利润因子容易出现大幅波动。</p>
<p>另一方面，利润因子具有不对称性。当利润处于低位时，低利润长期不可维持。同时，如果对应标的产品价格也处于低位，那么容易出现低位反弹情形。当利润处于新高时，说明产品因为供需矛盾或其他因素开始出现短暂的暴利现象。当价差和利润开始出现偏离正常范围的信号时，往往说明行情还未结束。在这种情况下，容易产生投机情绪，引发价格持续巨幅波动，甚至接连创下历史新高。如果此时投资者对价格攀升没有很好的预估，仅按照历史区间强行做空则容易出现大幅亏损。</p>
<p>综上所述，上下游产品的价差和利润因子因其超额利润不可长期持续，比较适合做回归和统计分析。由于利润因子的不对称特性，价差和利润因子的做多策略比做空策略容易，利润因子的做空和平仓策略需要结合其他因子或信号模型。不过，在将上下游产品的价差和利润因子仅作为单项因子进行探讨时，由于价差和利润因子比较适合发现低位反弹和高位投机的先发信号，不适合作为平仓信号进行讨论，所以本文不对价差和利润因子进行回测。</p>
<p>
    <strong>[测试表现]</strong>
</p>
<p>上游因子</p>
<p>笔者通过观察上游产品的价差和利润因子分布情况得知，上游产品的价差因子均出现较为显著的右偏长尾状态，不经过调整，无法使用回归模型或统计模型进行分析。由于上游产品的定价权和议价权较高，上游可以享受相对较高的超额回报，所以容易出现右偏长尾形态。对于非正态分布的价差因子，本文介绍三种方式调整因子结构，使因子尽量符合正态分布规律。</p>
<p>
    <img src=\"http://www.qhdb.com.cn/UploadFiles/ArtImg/20231203/20231203230146_3.jpg\" style=\"float:none;\" title=\"231204c01.JPG\" border=\"0\" hspace=\"0\" vspace=\"0\"/>
</p>
<p>图为上游石脑油—原油价差和利润因子分布</p>
<p>方法一：Bootstrap自助抽样法。Bootstrap自助抽样法的原理为中心极限定理，即便原始数据总体不符合正态分布，但只要样本规模足够大，且数据并非在很大程度上偏离正常值，那么从多个样本得到的均值将会呈现出钟形正态曲线。要估计统计量或模型参数的抽样分布，一个简单有效的方法是，从样本自身有放回地抽取更多样本，并对每次重抽样重新计算统计量，这一过程被称为自助法，自助法不需要假设数据或抽样统计量符合正态分布。</p>
<p>在构建过程中笔者发现，出于价格和利润分布特性，数据会出现多峰情况或非线性变化。即使通过重抽样，上游因子仍然无法呈现标准的正态分布特征，这是由产品会出现相对固定的价格区间和利润区间造成的。本文设置重抽样方式为将数值分为三个区间：0%—5%低位区间、5%—95%均值区间、95%—100%高位区间，在每次抽样过程中取数值区间的均值，使用随机数生成时间序列，重复1000次随机抽样，随着数据增加进行增量训练。调整测试后，分布结果显示，以石油裂解价差因子为例，因子的高位区间从2018年6月的500—600元/吨区间变为2023年1月的1000—2000元/吨区间，低位区间从2018年6月的-100—0元/吨区间变为2023年1月的-200—0元/吨区间，均值区间变化不明显。经过调整测试后，各区间分布基本符合正态分布特征。</p>
<p>
    <img src=\"http://www.qhdb.com.cn/UploadFiles/ArtImg/20231203/20231203230157_4.jpg\" style=\"float:none;\" title=\"231204c02.JPG\" border=\"0\" hspace=\"0\" vspace=\"0\"/>
</p>
<p>图为石油裂解价差因子Bootstrap重采样分析</p>
<p>笔者通过观察上游产品重抽样后的价差和利润因子得知，经过重抽样，模型可以较好地分离出低利润和高利润区间，低利润区间基本对应PTA价格低位区间。然而，利润因子的高位区间基本对应PTA价格的拉升阶段。其中，石油裂解价差因子表现良好，能够很好地对应PTA价格波动的不同阶段。不过，PX—石脑油价差和PX利润因子由于前期PX价差利润处于相对高位，而后续价格持续走低甚至走负，导致低位信号频繁出现，而高位信号几乎没有。</p>
<p>方法二：使用Box—Cox函数将数据值进行调整。Box—Cox变换是一种广义的幂变换方法，用于连续响应变量不满足正态分布的情况。Box—Cox变换之后，可以在一定程度上减小不可观测的误差和预测变量的相关性。对于长度为N的数值序列X=[x1，x2，x3…xn]，其带有一个参数的Box—Cox，变换后公式为 &lt;Z:\KT2023\231204c1.tif &gt;。其中，i = 1，2，3…N-1。此变换仅有一个参数Lambda。如果Lambda值等于0，则进行初始序列的对数变换；如果Lambda值不等于0，则变换为幂律。如果Lambda 参数等于1，即使序列移位，因为从其每个值中减去了单位元素，所以初始序列的分布规律保持不变。</p>
<p>Box—Cox变换包含以下特例：</p>
<p>
    <img src=\"http://www.qhdb.com.cn/UploadFiles/ArtImg/20231203/20231203230207_5.jpg\" style=\"float:none;\" title=\"231204c2.JPG\" border=\"0\" hspace=\"0\" vspace=\"0\"/>
</p>
<p>为了使结果序列的分布规律尽可能地接近正态分布，必须选择Lambda参数的最优值。</p>
<p>
    确定此参数最优值的一种方法是最大化对数似然函数<img src=\"http://www.qhdb.com.cn/UploadFiles/ArtImg/20231203/20231203230219_6.jpg\" style=\"float:none;\" title=\"231204c3.JPG\" border=\"0\" hspace=\"0\" vspace=\"0\"/>
    。其中<img src=\"http://www.qhdb.com.cn/UploadFiles/ArtImg/20231203/20231203230231_7.jpg\" style=\"float:none;\" title=\"231204c3.JPG\" border=\"0\" hspace=\"0\" vspace=\"0\"/>。
</p>
<p>我们可使用一个简单搜索，在一个选定的范围内以小距改变Lambda参数值的似然函数值,选择最优Lambda参数，使得似然函数在该参数值下达到最大值，这样即可得到数值正态变换的最佳函数方程。</p>
<p>虽然调整后的因子与原始数据的分布性有较好改变，但是由于2020年3月出现负油价状况，石油裂解价差因子调整后，负值离散情况更加严重。这是不可抗现实因素造成的，为测试数据模型的鲁棒性，此处不针对负值点做处理。</p>
<p>下面笔者对Box—Cox方法调整后的因子进行测试，通过Box—Cox调整后的因子实测效果与Bootstrap自助抽样法后的效果差别不大，调整后的因子能够很好地反映石油裂解价差与PTA价格区间的关系。比如，2018年1月至2022年12月，当石油裂解价差处于低位时，PTA也处于相对低位；当石油裂解价差处于上涨区间时，PTA也会跟随上涨。同样，由于PX价差和利润持续走低，其发出的信号无法对PTA价格走势或价格区间判断进行有效指导。</p>
<p>方法三：将上游产品的价差和利润因子与其对应的价格数据相除，转化为具有经济学意义的比值，通过比值方式调整时间或其他因素导致的数据形变。前文使用统计学工具对数值进行调整，可能会出现数据具有数学意义，但实际并不符合经济学意义的状况。此处将价差和利润因子除以其对应的产品价格，获得产品的附加值比率（利润率）因子。从现实角度出发，一个相对成熟的产业，附加值比率或利润率会控制在相对均衡的位置。因此，理论上比率分布比价差类的数值型分布更加稳定。</p>
<p>下游因子</p>
<p>下游因子除聚酯瓶片利润因子外，基本为正态分布或轻微右偏状况，不经过调整也可以直接用回归模型或统计模型进行分析。这与PTA基本面研究相符，下游的定价权和议价权没有上游强势，价格关系受市场供求主导，且具有一定的季节性。因此，下游产品的利润为正态分布且具有一定的回归周期。</p>
<p>通过测试可知，下游产品的利润因子测试效果不如上游产品的价差和利润因子，高利润和低利润区间分布没有明显的差异化，甚至出现固定的周期效应，也无法准确分析出不同利润区间对应的PTA价格区间。同样，笔者将利润除以对应的产品价格获得利润率，换算后得知，利润率因子的分布也基本符合正态分布特征。</p>
<p>虽然下游利润率因子的测试效果和利润因子基本一致，效果不甚理想，但其中短纤利润率因子能够较好地反映其与PTA价格的关系，当PTA价格处于高位时，短纤利润率会处于极低位置；当PTA价格处于低位时，短纤利润率会处于极高位置。这符合上下游产品定价与利润的关系，但由于下游产品仅短纤利润率因子能够正常反映其与PTA价格的关系，所以可能不具有普遍指导意义。</p>
<p>
    <strong>[研究结论]</strong>
</p>
<p>本文主要探讨PTA上下游产品的价差和利润因子与PTA价格的关系，使用三种方式对数据类型进行分析和调整：一是使用Bootstrap自助抽样法，对数据样本进行重抽样；二是使用Box—Cox方法调整数据，使其符合正态分布特征；三是使用比值法解决数据因时间和其他因素产生的形变问题。根据调整结果，测试调整因子是否符合预期效果。</p>
<p>从调整方式上看，第一，Bootstrap自助抽样方法能够很好根据前置预设条件将明显的偏态数据进行分类，并且在分类后数据特征符合正态分布类型，适合进一步深入细化探讨偏离值问题，如果数据本身符合正态分布特征则没必要进行重抽样。</p>
<p>第二，Box—Cox方法也能较好地调整数据样本，使数据分布形态向正态分布靠拢，测试结果与重抽样效果类似。不过，由于Box—Cox算法问题，模型不接受负值计算，在转换过程中只能以等差方式调整负值数据而不能等比例调整，容易显著放大极小偏离值的问题。</p>
<p>第三，使用比值法将转换数据类型，本质上是对数据的重构，转换数据内涵和意义。在本次测试中比值法表现不显著，主要原因在于这类方法明显受到外界因素的制约。以石油裂解价差因子为例，当被除数（石油价格类因子）出现极端波动时，会同样等比放大比值因子的数值；以下游利润因子为例，当数值经常呈现周期波动时，比值法无法有效去除因周期带来的影响，需要使用其他工具尝试去除可能存在的周期性。如果不针对数据细节进行处理，比值法则没有较强的稳定性。</p>
<p>从测试结果的表现来看，上游产品的价差和利润因子能够更加明显地反映其与PTA价格的关系，特别是石油裂解价差类数据，经过调整后，能够较好的在PTA价格处于低位和上涨阶段发出信号。下游产品的利润因子基本呈现正态分布特征，但测试效果不佳，除短纤利润因子外，其他因子发出的信号均无法与PTA价格区间进行对应。</p>
<p>进一步优化目标：首先，通过本文介绍的三种方法，可以获取不同类型的偏离值，且偏离值也呈现正态分布特征。我们可以针对这些偏离特征和数据变化构建新的信号模型，使得上下游产品的价差和利润因子的偏离信号更加精准和可控。其次，针对上游PX因子表现欠佳问题，可以使用滚动窗口模型或增加近期权重调小远期权重的方式，减轻历史行情带来的影响。再次，针对比值法出现的不稳定性，可以事先调整被除数的波动范围，减轻其对比值的影响。最后，针对下游数据出现的连续周期性特征，可以尝试使用滤波法去除周期性影响再对数据进行测试。整体上，PTA上游产品的价差因子与PTA价格区间具有关联性，可以尝试将上游价差因子与其他策略模型组合提升策略的稳定性和收益率。（作者单位：中州期货）</p>
""","wordnum":"4303","createtime":"2023/12/3 22:59:22"}]





# json_str[0]['content'] = content
with open('2023-12-04_206972.json', 'w', encoding='utf8') as f:
    json.dump(json_str, f, indent=4)
